Extracció de les regions promotores

Enrera

Proteïna 1

 ./SS  AC090953.seqFASTA.txt 50460 50760

CTCCTTGCAGCTATGCCACACACACAGCCTTTCTGAATCAGAGGGTATTAGTCTTTCCTT
CTGAACTCTTGGGATATTCCTGTTTTGATTTGGCTCTAGCAGTGACCACACCGAGTTGTG
CAAAGCCTGGGAACAGTGAGGACATTAGGACCAGGAGTGACGCGCACGCTTGGCTCTGGG
TTGTGTCTGGCAGAGGGCTCTCGGCTGAGTGGAGCTATGTGTGAAAGGAAACCAGGCACT
GCCTGCCGGCTTTACATCTGTTGATCTGACCTGACTGGAAGCGTCCAAAGAGGGACGGCTG

Proteïna 2

 ./SS  AC090953.seqFASTA.txt 140966 141266

GGTTTAACTTCGCCGGAACCGGCCTGGGCTCGGCATCATCAGGTCGCGCCGGGCAAGGAC
TAGCCCTTCCGGCGCATAGGCAATGACGCAACTCCGCCCTGCGCGGCCAAATGGATAACC
GGTAGCGGTCACCATGGAGATGGCTGAACTAGGGGCGGAGACACTGGGAAGACTGAAAGC
TTGCTCAGCGGGGTCGCGCACCGCTCCTCCTATTGGGCGGCAGCGACCAATAGAATGTGG
GGCTCGCCCGCGCTGCTACGTCACGTCTGGGACCGCGGAGTATTCCAGGCGCCTGCAACTA

Proteïna 3

./SS  AC090953.seqFASTA.txt 140909 141109

GGGTAACGCCCCAGCAGTCCGAGGCCAGCTCCGAGGGTTTAACTTCGCCGGAACCGGCCT
GGGCTCGGCATCATCAGGTCGCGCCGGGCAAGGACTAGCCCTTCCGGCGCATAGGCAATG
ACGCAACTCCGCCCTGCGCGGCCAAATGGATAACCGGTAGCGGTCACCATGGAGATGGCT
GAACTAGGGGCGGAGACACTG

Comentaris:

Com es pot comprobar les seqüències promotores de la proteïna 2 i 3 situades en Forward  i  Reverse respectivament es troben solapades.
Per les seqüències promotores de la Proteïna 1 i de la Proteïna 2 es van seleccionar una seqüència promotora de 300 pb, ja que en un primer anàlisis no es va trobar la regió promotora TATA, posteriorment com es podrà observar més endevant es va veure que en cap de les tres seqüències promotores hi era present, fins hi tot baixant el cutoff al mínim. Per contra per la seqüència promotora de la Proteïna 3 van ser seleccionades 200 pb upstream del inici del gen.
 
 



Utilització del MatInspector a TRANSFAC:

 Utilitzant las seqüència AC090953 no enmascarada amb les regions promotores previament seleccionades es va accedir a la base de dades TRANSFAC per utilitzar el programa MatInspector. Es van seleccionar la col.lecció de matrius de vertebrats. Primerament es va realitzar una cerca individual per cadascuna de les regions promotores seleccionant la matriu TATA_01. No es van obtenir resultats en aquesta cerca, per tant es va repetir però ampliant la regío promotora de la Proteïna 1 i la Proteïna 2 fins a 300 bases. El nou anàlisi tampoc va proporcionar resultats.
Finalment es va realitzar una cerca per a totes les matrius presents a la base de dades amb els paràmetres de 100% a matching i 85% d'score de les matrius Els resultats obtinguts per les 3 proteïnes van ser convertits a format gff per tal de poder obtenir arxius que fossin  utilitzats per gff2ps per la seva visualització.

Per tal que el programa del gff2ps pugui utilitzar l'arxiu de sortida que proporciona el MatInspector, va ser necessari aplicar una petita comanda per calcular la llargada de la regió promotora. Aquesta llargada sumada a la posició inicial de la seqüéncia, que proporciona el  programa, suministrava les dues posicions requerides
 

fgrep -  Matinspectorgen2.txt | gawk '{ print "Promgen2", $1, "MatIns", $3, length($10)+$3, $8, "-", ".", $1}'
./gff2ps_v0.97b gen2prom.gff MatinspectorGene2.gff > Gen2Prom.ps
 

fgrep -  Matinspectorgen5.txt | gawk '{ print "Promgen5", $1, "MatIns", $3, length($10)+$3, $8, "-", ".", $1}'
./gff2ps_v0.97b gen5prom.gff MatinspectorGene5.gff > Gen5Prom.ps
 

fgrep -  Matinspectorgen4.txt | gawk '{ print "Promgen4", $1, "MatIns", $3, length($10)+$3, $8, "-", ".", $1}'
./gff2ps_v0.97b gen4prom.gff MatinspectorGene4.gff > Gen4Prom.ps

Enrera